La Recuperación de Información en español y la normalizacion de términos

نویسندگان

  • Carlos G. Figuerola
  • Ángel F. Zazo Rodríguez
  • Emilio Rodríguez Vázquez de Aldana
  • José Luis Alonso Berrocal
چکیده

Most of the Information Retrieval Systems uses counts of frequencies of the words that occur in documents. Such counts entail the need of normalizing these terms. A simple normalization of characters (upper/lowercase, accents and other diacritical ones) seems insufficient, since many words, by morphologic inflection or derivation, could be grouped under an only form, when having very near semantic mean. Several algorithms of normalization are analyzed and tested experimentally to evaluate their effectiveness.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Aplicación de Técnicas de Recuperación de Información a un Glosario de Términos de Internet Desarrollado Utilizando Tecnología JSP

Resumen. En este artículo se describe un sistema que facilita las consultas a un glosario de términos sobre Internet publicado por la Asociación de Técnicos de Informática (ATI). La aplicación permite el acceso a las definiciones de cualquiera de los términos, escritos tanto en inglés como en español. Además, se facilita el mantenimiento del glosario, permitiendo publicar automáticamente nuevos...

متن کامل

Ornitología Virtual: Caracterizando a #Chile en Twitter

Este art́ıculo presenta un análisis de los tweets recolectados el 28 de Octubre de 2012, en el contexto de las elecciones municipales de 2012 en Chile. Dicho análisis se realiza mediante una metodoloǵıa basada en literatura previa, en particular en técnicas de recuperación de la información y de análisis de espacios de información. Como resultado, se determinan: 1) caracteŕısticas demográficas b...

متن کامل

Información colocacional y recuperación de la información

Este proyecto tiene como objetivo investigar la significación de la información colocacional en Recuperación de la información (RI). Una colocación es una relación entre dos unidades léxicas (UL) L1 y L2 tal que para expresar un significado específico en relación con L1 la elección de L2 no es libre (Mel' uk 1995). Así, para expresar el sentido 'hacer lo que está previsto que se debe hacer' en ...

متن کامل

Distinción semántica de compuestos léxicos en Recuperación de información

Resumen: La consideración de sintagmas no parece producir mejoras significativas en los modelos clásicos de Recuperación de Información. En general, se acepta que los criterios de proximidad proporcionan mejores resultados que un criterio de adyacencia. El trabajo que se presenta explora la hipótesis de que no todos los compuestos léxicos deben considerarse de la misma forma. Se propone un proc...

متن کامل

[Google: Searches, analyses and networking in the health care environment].

La enfermerı́a, como todas las disciplinas de las Ciencias de la Salud, se encuentra en constante cambio y requiere de un gran esfuerzo investigador y formativo por parte de sus profesionales para garantizar la mejor atención y los mejores cuidados. El acceso al mejor conocimiento cientı́fico disponible y las Tecnologı́as de la Información y Comunicación (TIC) juegan un papel fundamental en esta p...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Inteligencia Artificial, Revista Iberoamericana de Inteligencia Artificial

دوره 8  شماره 

صفحات  -

تاریخ انتشار 2004